6自由度(DoF)位姿估计是计算机视觉与机器人技术中的一项关键技术,它能从给定的输入图像中估计物体的6DoF位姿,即3DoF平移和3DoF旋转,已经成为机器人操作、自动驾驶、增强现实等领域中的一项至关重要的任务。首先,介绍了6DoF位姿的概念以及基于特征点对应、基于模板匹配、基于三维特征描述符等传统方法存在的问题;然后,以基于特征对应、基于像素投票、基于回归和面向多物体实例、面向合成数据、面向类别级的不同角度详细介绍了当前主流的基于深度学习的6DoF位姿估计算法,归纳整理了在位姿估计方面常用的数据集以及评价指标,并对部分算法进行了实验性能评价;最后,给出了当前位姿估计面临的挑战和未来的重点研究方向。
卷积神经网络(CNN)已成功用于敦煌古壁画的朝代分类。针对敦煌壁画的数据量有限,采用某些数据增强方法对训练集进行扩充时反而会降低预测准确率的问题,提出了一种基于注意力机制和迁移学习的残差网络(ResNet)模型。首先,改进了残差网络的残差连接方式;然后,使用极化自注意力(POSA)模块帮助网络模型提取图像的边缘局部细节特征和全局轮廓特征,增强网络模型在小样本环境下的学习能力;最后,改进分类器的算法,提高网络模型的分类性能。实验结果表明,所提模型在敦煌壁画DH1926小样本数据集上,取得了98.05%的朝代分类准确率,与标准的ResNet20网络模型相比,所提模型的朝代识别准确率提高了5.21个百分点。
热轧工序作为钢铁生产的核心环节,具有严格的生产连续性和复杂的产品工艺要求,而紧急订单的随机到达和紧急交货期要求会对生产连续性和质量稳定性产生不利影响。针对这类紧急订单插入的动态事件,提出一种热轧重调度优化方法。首先,分析了订单扰动因素对调度方案的影响,并以最小化订单拖期惩罚和板坯跳跃惩罚加权和为优化目标,建立了热轧重调度问题的数学模型。然后,设计了热轧重调度分布估计算法(EDA)。该算法针对紧急订单的插入式处理方式,提出一种基于插入位置的整数编码方案;结合模型特征设计了概率模型;并综合考虑目标与约束,定义了基于惩罚值的适应度函数。通过实际生产数据进行仿真实验,验证了模型和算法的可行性和有效性。
医学图像的清晰与否直接影响临床诊断。由于成像设备与环境因素的限制,往往不能直接获得高分辨率的图像,且大多数智能终端的硬件并不适合运行大规模深度神经网络模型,因此提出一种拥有较少的层和参数的轻量密集神经网络模型。首先,网络中使用密集块和跳层结构进行全局和局部图像特征学习,并将更多特征信息传入激活函数,从而使网络中浅层低级的图像特征更容易传播到高层,由此提高医学图像超分辨率重建的质量;然后,采用分阶段方法训练网络,并以双任务损失加强网络学习中的监督指导,从而解决高倍图像超分辨率重建导致的网络训练难度增加的问题。实验结果表明,与最近邻(NN)插值、双线性插值、双立方插值、基于卷积神经网络(CNN)的算法以及基于残差神经网络的算法相比,所提模型能更好地重建出医学图像的纹理细节,获得更高的峰值信噪比(PSNR)和结构相似性(SSIM),在训练速度和硬件消耗方面均取得了良好的效果,具有较高的实用价值。
虽然基于循环神经网络(RNN)的会话推荐算法可以有效地对会话中的长期依赖关系进行建模,并且可以结合注意力机制来刻画用户在会话中的主要目的,但它在进行会话建模的过程中无法绕过与用户主要目的不相关的物品,易受其影响以致降低推荐精度。针对上述问题,设计了成对编码方案来将原始输入序列嵌入向量转化为一个三维张量表示,使得非相邻的行为也能够产生联系。通过二维卷积神经网络(CNN)来处理该张量以捕获非相邻物品间的联系,并提出了引入用于会话推荐的二维卷积神经网络的神经注意力推荐机(COS-NARM)模型。该模型能有效跳过序列中与用户主要目的不相关的物品。实验结果表明,COS-NARM模型在DIGINETICA等多个真实数据集上的召回率和平均倒数排名(MRR)都得到了不同程度的提升,且优于NARM、GRU-4Rec+等所有基线模型。在上述研究的基础上,将欧氏距离引入COS-NARM模型,提出了OCOS-NARM模型。利用欧氏距离直接计算不同时刻兴趣间的相似度以减少模型的参数,降低模型的复杂度。实验结果表明,欧氏距离的引入不仅使得OCOS-NARM模型在DIGINETICA等多个真实数据集上的推荐效果得到了进一步的提升,而且使OCOS-NARM模型的训练时间相较COS-NARM模型缩短了14.84%,有效提高了模型的训练速度。
针对中药材种类繁多、数据量稀少以及难以对其导管进行分类的问题,提出一种基于多通道颜色空间与注意力机制模型的卷积神经网络改进方法。首先,采用多通道颜色空间将RGB颜色空间与其他颜色空间合并为6通道作为网络输入,使网络学习亮度、色调和饱和度等特征信息,弥补数据量的不足;其次,在网络中加入注意力机制模型,其中通道注意力模型将两个池化层紧密连接到一起,空间注意力模型将多尺度空洞卷积结合到一起,使网络将注意力聚焦于小样本中关键的特征信息。实验结果表明,针对34种中药材样本的8 774张导管图像,采用多通道颜色空间和注意力机制模型的方法,与原始ResNet网络相比,准确率分别提升了1.8个百分点和3.1个百分点,将二者结合后准确率提升了4.1个百分点,说明所提方法对小样本分类的准确率有着大幅度的提升。
特征选择对于分类器的分类精度和泛化性能起重要作用。目前的多标记特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择,没有考虑专家特征,因此多标记特征选择算法的运行时间较长、复杂度较高。实际上,在现实生活中专家依据几个或者多个关键特征就能够直接决定整体的预测方向。如果提取关注这些信息,必将减少特征选择的计算时间,甚至提升分类器性能。基于此,提出一种基于专家特征的条件互信息多标记特征选择算法。首先将专家特征与剩余的特征相联合,再利用条件互信息得出一个与标记集合相关性由强到弱的特征序列,最后通过划分子空间去除冗余性较大的特征。该算法在7个多标记数据集上进行了实验对比,结果表明该算法较其他特征选择算法有一定优势,统计假设检验与稳定性分析进一步证明了所提出算法的有效性和合理性。
针对拍摄场景中物体运动不一致所带来的非均匀模糊,为提高复杂运动场景中去模糊的效果,提出一种多尺度编解码深度卷积网络。该网络采用"从粗到细"的多尺度级联结构,在模糊核未知条件下,实现盲去模糊;其中,在该网络的编解码模块中,提出一种快速多尺度残差块,使用两个感受野不同的分支增强网络对多尺度特征的适应能力;此外,在编解码之间增加跳跃连接,丰富解码端信息。与2018年国际计算机视觉与模式识别会议(CVPR)上提出的多尺度循环网络相比,峰值信噪比(PSNR)高出0.06 dB;与2017年CVPR上提出的深度多尺度卷积网络相比,峰值信噪比和平均结构相似性(MSSIM)分别提高了1.4%和3.2%。实验结果表明,该网络能快速去除图像模糊,恢复出图像原有的边缘结构和纹理细节。
目前关于差分隐私数据流统计发布的研究仅考虑一维数据流,其方法无法直接用于解决二维数据流统计发布中可能存在的隐私泄露问题.针对此问题,首先提出面向固定长度二维数据流的差分隐私统计发布算法——PTDSS算法.该算法通过单次线性扫描数据流,以较低空间消耗计算出满足一定条件的二维数据流元组的统计频度,并经过敏感度分析添加适量的噪声使其满足差分隐私要求;接着在PTDSS算法的基础上,利用滑动窗口机制,设计出面向任意长度二维数据流的差分隐私连续统计发布算法——PTDSS-SW.理论分析与实验结果表明,所提算法可安全地实现二维数据流统计发布的隐私保护,同时统计发布结果的相对误差在10%~95%.
针对使用并行库JOMP的程序在性能方面存在的不足,提出一个可以分离并行逻辑和功能逻辑的并行框架。该框架对程序中需要并行处理的部分进行标记,采用面向方面和运行时反射技术实现被标记部分的处理,其中面向方面技术用于实现并行逻辑的分离和编织,运行时反射技术用于获取运行时被标记部分的相关信息,以并行库(waxberry)的方式实现了该并行框架。使用基准测试程序JGF套件中的三个测试程序对并行库进行了测试,实验结果表明,应用该并行库的程序可以获得较好的性能。